'''
    todo 1、技术说明
    项目通过公司内部人资资源系统数据，通过数据的基本ETL(数据清洗过滤和汇总)对数据进行基本的预处理，
    通过python的numpy、pandas、matplotlib和seaborn进行各维度数据分析，
    经过数据分析得到分类特征较好的特征数据，对数值型数据、类别型数据、有序性数据分别进行处理和分析，
    使用label encoder和one encoder分别对类别数据进行特征编码，
    处理组合后的数据特征后形成特征向量，通过Python的Scikit-learn机器学习库的机器学习算法寻找数据之间存在的关系，
    从而为公司人力资源及决策层提供信息建议及决策建议
'''
import numpy as np
import pandas as pd
import matplotlib as plt

data1 = pd.read_csv('../data/fig/train.csv')
data2 = pd.read_csv('../data/fig/test2.csv')
print(data1.info())
print(data2.info())






